智能全局搜索，我们做了个本地模型，并且开源了！

deepin 深度操作系统 2023-12-28

在这个信息爆炸的时代，我们常常陷入数据的海洋中，无从下手。各种数据和文件散落在各个角落，想要找到特定的信息常常需要花费大量的时间和精力。现在，随着deepin全局搜索接入AI，我们能够在海量的数据中快速精准地定位到所需的信息，从而极大地提高信息检索效率。

接入AI后的全局搜索，具备两大核心亮点功能：自然语言搜索和图片内的文字搜索，能够为用户提供更加便捷、准确、实用的搜索体验。

自然语言搜索功能可以帮助用户通过自然语言形式输入关键词，从而快速地搜索到所需内容；而图片内的文字搜索功能则是一种创新性的搜索方式，用户可以在图片中查找关键词或短语，无需手动输入文本信息，为用户提供更加便捷、准确、实用的搜索体验。

自然语言搜索

功能特点

智能全局搜索支持强大的自然语言搜索功能，这意味着你可以用自然的语言描述你想要检索的信息，而不需要使用特定的关键词。

使用场景

图片内文字搜索

功能特点

智能全局搜索能够识别图片中的文字，并将其转化为可搜索的文本。这意味着你可以直接搜索图片中的文字，即可找到这张图片。

该功能不仅适用于学习和工作，也可以帮助你在旅行中快速搜索景点信息、菜谱等等。

使用场景

本地模型是如何实现的？

以上的AI能力，均是基于本地模型实现。基于国际知名的开源预训练模型，我们开发出本地模型内置于全局搜索，体量更小、占用算力更少，性能也更稳定。

对于自然语言搜索能力，是通过内置的自然语言解析的AI模型实现，该模型能较好地解析自然语言，理解用户搜索意图，然后在文件管理器中，找到最符合用户意图的文件。

后续我们将进一步提高用户意图预测的准确性，并提升搜索的性能表现。同时，还会扩大可搜索的范围（如：搜索不限于文件标题，文件内容也可以搜索），实现“万物皆可搜”的目标。

对于图片文本内容搜索，是通过内置的OCR识别的AI模型实现，该模型能较好地识别图片中的文本信息，使得全局搜索可以搜索到相应的信息。

后续我们将持续优化识别精度、增加更多的识别语言。同时，我们也计划引入更多图片识别模型，如：图片内容识别。届时，用户可直接描述图片的画面内容，即可搜索到对应的图片，如：帮我找一下我家小猫的图片。

同时，智能全局搜索应用已经开源，欢迎大家来共建，创造出更多好用的功能。

开源地址：

https://github.com/linuxdeepin/dde-grand-search

往期精选 | Selection in the past

继续滑动看下一个